{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

Модераторы: good_cat, wasyaka

Аватара пользователя
Fenix
Администратор

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#1

Сообщение Fenix »

wasyaka писал(а): May 20 2018

В сборках подключены и активированы словари для голосового синтезатора IVONA Maxim & Tatyana (синтезатор в сборку не входит)
Звучание в целом удовлетворительное.
Выявленные ошибки и вопросы задаём здесь. Ошибки в произношении слов присылайте в составе целого предложения по шаблону.
Слово: Это слово в составе предложения.



С использованием программы Balabolka
► Показать
Портабельная версия Balabolka с включёнными и настроенными словарями для обработки и последущей прослушки - записи. :music:

Правая кнопка мышки по окну словарей. В выпадающем меню Профили выбираем нужное действие:
  1. Полный - Обработка всеми словарями Ctrl+T
  2. Без Ё - Обработка словарями текстов с проставленным ё Ctrl+T
  3. Обработка омографов для ручного пополнения словарей Ctrl+T
  4. Чтение обработанного текста F5
Новые слова(21.05)

Демагог одной кнопкой от пользователя tonio_k Инструкция:
  1. Открываем файл с книгой
  2. Нажмаем Ctrl+F2
  3. В открывшемся окне запускаем
    00_ПЕРВИЧНАЯ ОБРАБОТКА.lua
  4. Дожидаемся информационного окна о завершении подготовки книги
  5. Можно приступать к чтению вслух или записи в mp3

Необходимо установить синтезатор голоса IVONA Maxim! Словари ориентированы исключительно на него.

 ! Сообщение из: evmir_troll-hunter
:pdf icon: комментарии к теме

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#2

Сообщение tonio_k »

wasyaka писал(а):
19 июл 2018 13:15
С использованием ПО Demagog
я бы вам рекомендовал перевести словарь 1.3. corector омо.rex в формат DIC. Скорость обработки текста увеличится в разы! А результат будет тот же.
Посмотрите как выглядит ваш словарь в формате DIC:

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#3

Сообщение wasyaka »

tonio_k писал(а):
19 июл 2018 18:10
1.3. corector омо.rex в формат DIC.
Пример:
- Варвары съели Валю
В rex
- варвары съели вАлю
В dic
- варвАры съели вАлю
Это на вскидку - я пытался раньше в dic но из-за различных ошибок (уже все и не помню)
Тише едеш... :big_smile:
И в данный период я не использую Demagog.
Просто словари из BXD переконвертировал в REX и DIC за исключением Ё(поленился - звёзды - доп движения и не актуально...)

Аватара пользователя
good_cat
Администратор

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#4

Сообщение good_cat »

wasyaka, в словари DIC прокрались "ашипки":

Код: Выделить всё

авариях=<phoneme ph="ɐv'a rʲijəx"/"/>
адекватностями=<phoneme=<phoneme ph=""/>
карги=<phoneme ph="kɐrɡʲˈi>"/>

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#5

Сообщение wasyaka »

good_cat писал(а):
19 июл 2018 18:59
в словари DIC прокрались "ашипки":
Спасибо :drunkpals:
Ну куда ж без них :big_smile:

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#6

Сообщение tonio_k »

wasyaka писал(а):
19 июл 2018 18:50
Тише едеш...
согласен поспешил :shakehand:
Тогда такой вариант (гибрид) - скорость так же - в разы выше (для эксперимента еще в BXD объеденил


Отправлено спустя 13 минут 31 секунду:
good_cat писал(а):
19 июл 2018 18:59
карги=<phoneme ph="kɐrɡʲˈi>"/>
а что не так? ударение на "И"

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#7

Сообщение wasyaka »

tonio_k писал(а):
19 июл 2018 19:31
Тогда такой вариант (гибрид)
Можно и так, но лично для меня скорость обработки не актуальна.
Я пока слушаю главу 1 успеваю обработать главу 2 - выбираю не обработанные омографы те на которые нужно проставить ударение добавляю в словарь 1.5. homographs.bxd и обрабатываю этим словарём. ошибки словарей также правлю.
tonio_k писал(а):
19 июл 2018 19:45
а что не так? ударение на "И"
i>"/>

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#8

Сообщение tonio_k »

wasyaka, ошибка?
@([А-яЁё])\, омов\b=$1, сомОв
@([А-яЁё])\, околов\b=$1, сОколов

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#9

Сообщение wasyaka »

tonio_k писал(а):
19 июл 2018 20:08
ошибка?
Да должно \b

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#10

Сообщение tonio_k »

wasyaka, Прижимая мокрый платочек к распухшему носу.

Код: Выделить всё

(\w+(дав|ому|ьему)\b\s?(\w+)?)\s{1,4}(\bносу\b)=$1 нОсу
- добавить |шему

Код: Выделить всё

(\b(и|из|к|к [егоёих]{1,3}|по)\s?(\w+)?)\s{1,4}(\bносу\b)=$1 нОсу
почему не срабатывает?

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#11

Сообщение wasyaka »

tonio_k писал(а):
23 июл 2018 12:25
почему не срабатывает?
Чтоб сработало доп слово \s?(\w+)?
надо в строку добавить слово из не менее восьми символов (почему? - это как давай покрасим холодильник в чёрный цвет :thinking: :big_smile: )

Код: Выделить всё

(\b(аааааааа|и|из|к|к [егоёих]{1,3}|по)\s?(\w+)?)\s{1,4}(\bносу\b)=$1 нОсу
Я это доп слово при встрече удаляю (много ошибочных срабатываний)

Код: Выделить всё

\b(и|из|к|к [егоёих]{1,3}|по)\s{1,4}(\bносу\b)=$1 нОсу

Аватара пользователя
MoppoH
Обыватель

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#12

Сообщение MoppoH »

давно хотел спросить, почему вы в рег выражениях ставить \s обозначающий пробел, не проще просто пробел поставить, и еще ? после него, если пробел один, то ? и не нужен
(\b(и|из|к|к [егоёих]{1,3}|по) (\w+)) {1,4}\bносу\b=$1 нОсу
такое выражение не сработает?

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#13

Сообщение tonio_k »

MoppoH ваш (\b(и|из|к|к [егоёих]{1,3}|по) (\w+)) {1,4}\bносу\b=$1 нОсу у меня срабатывает. Без {1,4} - тоже. Но я сталкивался с тем, что пробелы иногда почему то не срабатывают. Меняю на \s и сразу реакция есть. А вообще, правило, где вместо пробела стоит \s более читаемое - в смысле сразу понятно, что тут пробел, а не глюки после долгого просмотра кода, где не понятно пробел это или скобки стоят далеко друг от друга. "Наглядность" напрямую зависит от выбранного шрифта и его размера.
Вообще, мне больше нравятся правила такого очень простого шаблона:
#((\bslovo\b|\bslovo\b)[^\.,!?-]{0,20})(\bzamena\b)=$1ZAMENA
#(\bzamena\b)([^\.,!?-]{0,20}(\bslovo\b|\bslovo\b))=ZAMENA$2
по этому шаблону пример будет так выглядеть:
(\b(и|из|к|к [егоёих]{1,3}|по)\b[^\.,!?-]{0,10})(\bносу\b)=$1нОсу
, где 10 (символов) - примерно одно слово "между" slovo и zamena
оно конечно не самый лучший вариант, но по мне - самый простой и легкий. Убирая из правила запятую или точку- тем самым допускаем её присутствие или, даже, захват соседнего предложения. Тогда становиться очень похоже на звездочки в DIC у Демагога, но эта широта как раз и не очень устраивает меня лично - слишком "широко" читается правило. Так что максимум - это убрать запятую.

Аватара пользователя
MoppoH
Обыватель

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#14

Сообщение MoppoH »

просто когда смотрю ваши варианты рег выражений, в них очень много разных якорей и символьных классов, которые в принципе не очень и нужны в них, конечно каждый выбирает как ему удобно, и не знаю почему в разных программах рег выражения работают по разному, а то можно сделать типа вот такого выражения, которое сразу заменяет очень многое

(?i)(?<=\b(край|нить|(глубин|куск|кусоч|облом[ок]|половин|правил|середин|сторон|тяжест|удар|участ|центр)\w{0,3}|част(и|ь|ью|ях))\b.)\b(бедра|гнезда|головы|души|дыры|доски|земли|игры|копья|лица|ноги|плиты|пятна|реки|руки|скалы|стены|страны|стрелы|судьбы|травы|тропы|щеки)\b=$+<

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#15

Сообщение tonio_k »

Ваш вариант под Максима или Николая?
Не спорю хитро сделано :thumbs_up: в итоге знак "< " на последнюю букву для каждого слова на конце, что для Николая - самое то, а вот для Максима - не подходит. Придется последней набор слов разбивать на соответствующее количество строк с правилами - под каждое слово с ударением. И 99% всех правил rex это наработки только от waska причем он эти правила (тысячи их) переносил из KoobAudio и подгонял под требования к rex в Балаболке. Создавались эти правила не один год. Думаю своё отношение к rex waska до сих пор меняет и оптимизирует. Только такой огромный массив уже не перелопатить. Что то вылезет - он корректирует, а в основном работает очень хорошо потому и корректировки в самих rex не так часты.
Если вас заинтересовала эта сборка под Максима, то, думаю, waska ваши предложения по корректировке и оптимизации правил rex обязательно примет на вооружение и внесёт изменения в существующий словарь

Аватара пользователя
Большой Ух
Наблюдатель

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#16

Сообщение Большой Ух »

доброго вам здоровица,спасибо ,
только вот при соханении аудио в балаболке ,при использовании движка ивона максим, программа вылетает,именно на максиме, милена и татьяна спокойно сохраняют аудио.
помогите разобраться

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#17

Сообщение wasyaka »

MoppoH писал(а):
23 июл 2018 21:56
и еще ? после него, если пробел один, то ? и не нужен
\s?(\w+)? -? означает может присутствовать, а может и нет, при вашем варианте к носу не сработает
( \s(\w+)?){1,}) - используется всё предложение (пропущенные(не использованные для правила) слова до ключевого заменяются пробелом) и это грубое правило, ниже(далее) по словарю более точные и т.д. отсюда и \s{1,4}, в отличии от KoobAudio где срабатывание на "первом встречном" :big_smile: и как бы наизнанку от точного к размытому :suspect: .Из-за этого я и отказался от проги и перешёл на REX.
tonio_k писал(а):
23 июл 2018 23:28
пример будет так выглядеть:
(\b(и|из|к|к [егоёих]{1,3}|по)\b[^\.,!?-]{0,10})(\bносу\b)=$1нОсу

Убирая из правила запятую или точку- тем самым допускаем её присутствие или, даже, захват соседнего предложения
[^\.,!?-]{0,10} - а почему 10, а не11? :big_smile:
(\b(блабла)(\w+)?([…,.!?:;])?(\s(\w+)?){1,})(\bугу\b)=$1 угУ
или
(\b(блабла)(\w+)?(\s(\w+)?([….!,?:;])?){1,})(\bугу\b)=$1 угУ
или
(\b(блабла)(\w+)?([….!,?:;])?(\s(\w+)?([….!,?:;])?){1,})(\bугу\b)=$1 угУ :big_smile:
И каждый выбирает по себе... :thank:

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#18

Сообщение tonio_k »

Большой Ух писал(а):
24 июл 2018 06:20
программа вылетает,именно на максиме
- кроме переустановки Движков - ничего в голову не приходит :dont_know:
wasyaka писал(а):
24 июл 2018 07:39
[^\.,!?-]{0,10} - а почему 10, а не11?
- в среднем длина слова в русском языке - 7 символов. 10 - это я с расчетом на "чуть выше средней" длины слова. Хотя все же в одно слово лучше сразу заложить 15 символов в правило. А вот если предполагать в правиле больше одного слова, то тогда по 10 символов на каждое слово должно быть достаточно. Если в предложении между словами нет запятых, (и это предусмотрено правилом) то можно и более "жадно" количество символов заложить. Чисто теоретически (среднестатистически), если нет запятых между найденными словами, значит нет смысловых отсылок одной части предложения к другой его части. И все прилагательные и глаголы по смыслу принадлежат одному единственному существительному. Здесь можно хоть 1000 символов заложить.

Аватара пользователя
balabolka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#19

Сообщение balabolka »

Большой Ух писал(а):
24 июл 2018 06:20
только вот при соханении аудио в балаболке ,при использовании движка ивона максим, программа вылетает,именно на максиме
Самая первая версия IVONA Maxim работала с ошибками, поэтому голос "вылетал" при чтении некоторых предложений. Скачайте и установите последнюю версию голоса "Максим" (кажется, это версия 1.6.76): она будет работать стабильно.

Аватара пользователя
Arex
Интересующийся

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#20

Сообщение Arex »

Вопрос по сборке.
Я хочу уточнить, все эти словари будут работать только в Балаболке? Или если я подключу TTS где-нибудь ещё, например в ICE Book Reader, они тоже будут работать?
MoppoH писал(а):
23 июл 2018 21:56
давно хотел спросить, почему вы в рег выражениях ставить \s обозначающий пробел, не проще просто пробел поставить
tonio_k писал(а):
23 июл 2018 23:28
Но я сталкивался с тем, что пробелы иногда почему то не срабатывают. Меняю на \s и сразу реакция есть.
Скорее всего, это потому что в тексте, помимо обычных пробелов, встречаются ещё и неразрывные пробелы. Выглядят они так же, но кодируются другим символом и по ним слова не переносятся на другую стороку.
Например, если тире стоит в начале строки (в диалоге), то после него ставится неразрывный пробел, а в остальных случаях в книгах перед тире ставится неразрывный пробел, а после него - обычный.
balabolka писал(а):
24 июл 2018 13:48
Скачайте и установите последнюю версию голоса "Максим" (кажется, это версия 1.6.76): она будет работать стабильно.
Ещё бы знать, где эту версию узнать. У меня установлена Hapro Speech2Go с пакетами голосов от Ivona и Nuance. И по Максиму удалось узнать лишь, что это IVONA 2 Maxim OEM.

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#21

Сообщение tonio_k »

Посмотрите на форуме ссылка на официальный сайт с лайфхаком
Для начала удалите то что у вас уже установлено для снижения вероятности конфликтов.

На счёт словарей: сборки включают словари, которые уже не совместимы между Балаболкой и Демагогом. Точнее словари от демагога ещё можно применить в Балаболке, но не наоборот.
(А надо бы поднять эту тему)
Что бы было понятно, словари это сборник правил замен в самом тексте. Т.е. если вы произведете замены в тексте в Демагог или Балаболке, то полученный текст IVONA Maxim будет читать уже в любой читалке. Но этот текст визуально выглядет местами "крякобразно" и не красиво. Так что лучше ограничеться Балаболкой или Демагогом

Аватара пользователя
Arex
Интересующийся

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#22

Сообщение Arex »

tonio_k, намного понятнее не стало. Насколько я разобрался, в сборки входят Балаболка или Демагог с набором словарей к ним. Эти словари по действию заменяют/дополняют лексикон, то есть выдают текст в родном формате для TTS-движка. Так?

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#23

Сообщение tonio_k »

Возможно я не до конца понимаю что вы Включаете в понятие"лексикон". Может мы говорим об одном и том же)))
Максим по умолчанию сам по себе неплохо читает. Многих и это устраивает.
Как вы прочитаете:
"Нам любые дороги дороги"
Движок прочитает только либо дорОги дорОги или дОроги дОроги
Задача словарей:
1) правильно заменить в нужных местах дороги на дОроги или дорОги
2) неизвестное Максиму слово дОроги перевести в родное Максиму < dOOrogi> *

*dOOrogi - условный и далёкий от реальности пример. Пишу со смартфона, словарей под рукой нет

Вот поэтому после Балаболки текст на 70% обычный (Максим и так их хорошо читает), остальное- родные для максима крякобразы. Что бы увидеть, что получаем на выходе, в Демагог или Балаболке при включенных словарях нажмите "показать измененный текст"


Отправлено спустя 4 часа 47 минут 41 секунду:
Fenix писал(а):
20 июн 2018 15:54
Демагог одной кнопкой от пользователя tonio_k

+ Обновлен Демагог до Version 7.29.352
+ Добавлен скрипт: 70_СКЛЕИТЬ НЕСКОЛЬКО КНИГ В ОДНУ
Если у вас несколько томов одной книги, скрипт позволяет склеить все эти тома в одну книгу. Это удобно если есть желание обработать все книги разом как одну. В конце каждого тома происходит автоматическая вставка номера тома по порядку.
+ Из за частых ложных срабатываний 10_REX_стандартные замены+все-всЁ.rex разбит на два файла: 1) 10_REX_стандартные замены.rex и 2) _vse_vsyo.rex
При этом, _vse_vsyo.rex по умолчанию отключен. Включать имеет смысл только если в тексте не встречаются слова "всё" с буквой Ё

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#24

Сообщение wasyaka »

tonio_k писал(а):
30 авг 2018 19:25
остальное- родные для максима крякобразы.
► Показать
Обработано Балаболкой, но и Демагог выдаст тоже,но с красной строкой...
И где кряки с зябрами? :suspect:

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#25

Сообщение tonio_k »

как бы вот...
► Показать
2) неизвестное Максиму слово дОроги перевести в родное Максиму < dOOrogi> *

*dOOrogi - условный и далёкий от реальности пример. Пишу со смартфона, словарей под рукой нет
Под кряки с зябрами я подразумевал понятный для Максима но не понятный для обычного человека фонемы типа <phoneme ph="stˈorɐnʊ"/>. - они то и кажутся крякобразами для непосвященных

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#26

Сообщение wasyaka »

tonio_k писал(а):
30 авг 2018 23:00
Под кряки с зябрами я подразумевал понятный для Максима но не понятный для обычного человека фонемы типа <phoneme ph="stˈorɐnʊ"/>. - они то и кажутся крякобразами для непосвященных
У меня два словаря: один в pls - читалка Homograph, второй в dic- читалка Balabolka - но нигде не использую замену текста на фонемы. на лету пережовывают... :big_smile:

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#27

Сообщение tonio_k »

wasyaka писал(а):
30 авг 2018 23:25
один в pls - читалка Homograph, второй в dic- читалка Balabolka
Ну, а у меня всё в одном. :wink: "Одной кнопкой" так сказать. Да и в процессе записи в mp3 или чтения вслух, эти крякобразы и не видны пользователю. Всё происходит "на лету". Виден только исходный текст книги. Про крякобразы я привел пример только что бы ответить на вопрос выше.

Аватара пользователя
Arex
Интересующийся

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#28

Сообщение Arex »

tonio_k, Спасибо за пояснения, значит я правильно понял.


Отправлено спустя 7 часов 21 минуту 52 секунды:
tonio_k писал(а):
30 авг 2018 23:00
Под кряки с зябрами я подразумевал понятный для Максима но не понятный для обычного человека фонемы типа <phoneme ph="stˈorɐnʊ"/>.
Кстати, а откуда они берутся? Где можно об этм почитать? Не вручную же по буковке записываются.
Где-то я тут видел программу, кажется, Транскриптор, так у неё результат работы был похожий. Но я думал, что это только для Алёны...

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#29

Сообщение wasyaka »

Arex писал(а):
31 авг 2018 07:56
Кстати, а откуда они берутся?
OpenPLS. Редактор PLS-словарей для IVONA TTS

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#30

Сообщение tonio_k »

wasyaka писал(а):
14 окт 2018 20:06
RGV rex.rar
Отсортировал по длине строки
► Показать
Может их в формат DIC поменять? быстрее будет работать

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#31

Сообщение wasyaka »

(\bконц)\s?(лагеря\b)=$1$2 -это из

Код: Выделить всё

(\b(администраци|атак|вместо|внутрь|вокруг|враждебных|враждующих|второго|границ|дартарского|двор|заключённы[ех]|западнее их|захвате|защитников|иотийского|канцелярия|картотека|комендант|конец|край|курсант|местного|мимо их|напротив|начальник|начальству|ночного|обитатели|обход|окраине|охран[енмауой]{1,3}|периметр|персонал|план|площадь|полевого|посреди|постановк|пределами|пределы|приверженцы|разбивк|регламентом|сворачиванию|середин|серёдке|снятие|состав|стенами|сторон|страшного|схема|территорию|типичного|треть|уголок|узник|устройство|участки|хозяев|центр|центре|части|часть|штаб|штурм)(\w+)?(\s(\w+)?){1,})(\bконц)?(лагеря\b)=$1 $6лАгеря
чтоб слитно...
0.575 версия Балаболки показывает время потраченное правилами - на первый взгляд: самый тормоз
(\w+(|)\b\s?(\w+)?)\s{1,4}(\b\b)=$1 сработка по окончаниям. При удалении \s?(\w+)?) на
децел меньше
(в|л|т) заменить на [влт] круглые на квадратные- прилично ускоряет .
надо смотреть... если смысл...
Извини - сейчас футбол - потом баиньки - прошлые сутки - на хлебушек с... работал

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#32

Сообщение tonio_k »

Чисто эксперимента ради попробуй все \s заменить на пробел. Не сегодня, конечно :big_smile:

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#33

Сообщение tonio_k »

wasyaka писал(а):
14 окт 2018 20:06
Проверил все словари, точнее ещё тестирую (674), но:
Такая мысль, словарь REX имеет множество ненужных строк, или строк, которые можно сократить за счет оптимизации в словаря[ фонем.

Например слова: "пола" и "адреса" - имеют только 2 варианта ударений.
По умолчанию Максим читает пОла и адресА
В словаре rex присутствуют "принудительные" замены: полА , Адреса
Следовательно все правила в rex, в которых есть исправления на пОла и адресА - лишние
Для надежности, можно в словаре фонем прописать $пола = <pOla>; $адреса = <adresA>
- c учетом регистра (что бы ранее сделанные исправления пОла и адресА не были подтерты

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#34

Сообщение wasyaka »

tonio_k писал(а):
02 ноя 2018 00:57
Такая мысль, словарь REX имеет множество ненужных строк
01_OMO_AUTO.rar
(33.34 КБ) 1048 скачиваний
Ответил на ветке Балаболки...
Это когда проставляеш вручную, чтоб сократить список...

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#35

Сообщение tonio_k »

wasyaka писал(а):
02 ноя 2018 08:30
01_OMO_AUTO.rar
► Показать
Демагог ошибки в словарях dic хорошо ищет :thumbs_up: . Это дубликаты с разными фонемами одного и того же слова


Отправлено спустя 2 дня 12 часов 36 минут 41 секунду:
Fenix писал(а):
20 июн 2018 15:54
Демагог одной кнопкой от пользователя tonio_k
05.11.2018
+Demagog Version 7.29.359
+Добавление правил в словари
+Изменение алгоритма записи в аудио в скрипте 51_ЗАПИСАТЬ В MP3.lua - обработка текста быстрее (на 10%-20%). 00_ПЕРВИЧНАЯ ОБРАБОТКА включена в работу скрипта
+Добавлена инструкция к ускоренному методу записи в MP3


Отправлено спустя 18 часов 39 минут 12 секунд:
wasyaka писал(а):
02 ноя 2018 08:19
часть отключил
задай фильтр в балаболке:
Неактивно
Регулярные
ПроизноситьКак ё думаю лучше и восстановить все слова где идет замена е на ё

Аватара пользователя
GIS88
Обыватель

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#36

Сообщение GIS88 »

1. Чтобы перенести ваши настройки в новую версию программы Balabolka достаточно перенести папку dictionaries или надо что то еще?
2. У меня правильно подключены словари или надо подключить все .bxd словари ?
https://cdn1.savepice.ru/uploads/2018/1 ... c-full.jpg

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#37

Сообщение tonio_k »

Fenix писал(а):
20 июн 2018 15:54
Демагог одной кнопкой от пользователя tonio_k
15.11.2018
+Demagog Version 7.29.360
+Оптимизация правил в словарях
+51_ЗАПИСАТЬ В MP3.lua переименован в 10_ОКНО - ЗАПИСАТЬ В MP3
+Изменение алгоритма записи в аудио в скрипте 10_ОКНО - ЗАПИСАТЬ В MP3.lua
+Добавлен скрипт 20_ПАКЕТНАЯ ЗАПИСЬ ВСЕХ КНИГ В ПАПКЕ
+70_СКЛЕИТЬ НЕСКОЛЬКО КНИГ В ОДНУ переименован в 30_СКЛЕИТЬ НЕСКОЛЬКО КНИГ В ОДНУ
+Добавлен скрипт .==============ЭКСТРЕННОЕ ЗАКРЫТИЕ ДЕМАГОГ============= -Что бы выйти из программы Демагог не дожидаясь завершения записи книги

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#38

Сообщение wasyaka »

GIS88 писал(а):
14 ноя 2018 17:46
У меня правильно подключены словари или надо подключить все .bxd словари ?
bxd подключаются для обработки текста - галки на них и ctrl+T, после обработки открыть в новой вкладке и сохранить, дальше как на фото - это для прослушки - записи.

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#39

Сообщение tonio_k »

wasyaka, интересный момент по целесообразности разбиения большого (по количеству символов) REX правила на два.
Например два правила:
► Показать
эти же два правила, но объединенные в одно:
► Показать
по времени особой разницы между ними нет.
Но все же объединение дает небольшой плюс к скорости обработки:
Два правила: 11,2 с.
Два в одном: 10,6 с.


Отправлено спустя 5 дней 6 часов 49 минут 31 секунду:
17.12.2018
+Demagog Version 7.29.362
+Оптимизация правил в словарях
+в сборку добавлен сторонний кодек ffmpeg.exe
В Демагоге в настройках аудиоконвертора в строке с параметрами можно поменять:
atempo=1.1 - ускорение/замедление чтения (=1.0 - стандартная скорость)
64k - степень сжатия
-+ переименован скрипт ЭКСТРЕННОЕ ЗАКРЫТИЕ ДЕМАГОГ в CtrlQuit. Теперь его можно запустить в любом окне комбинацией клавиш Ctrl+Shift+9
+ 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua Теперь скрипт можно запустить для текущего окна комбинацией Ctrl+Shift+1
+ Добавлен скрипт 40_ПРОДОЛЖИТЬ ЗАПИСЬ СЕРИАЛА В ПАПКЕ - продолжает запись с прерванного места из папки с файлами сериала

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#40

Сообщение wasyaka »

tonio_k писал(а):
17 дек 2018 00:32
по времени особой разницы между ними нет.
Но все же объединение дает небольшой плюс к скорости обработки
Немножко информации...
Самые медленные правила:
(\w+(|)\b\s?(\w+)?)\s{1,4}(\b\b)=$1
(\b\b)(\s?(\w+)?\s{1,4}(\w+(|)\b))= $2
которые я удалил, переделал в (пример из словаря)

Код: Выделить всё

@(\w+(авят|ает|аешь|азал|айте|аны|анял|ать|ашел|мают|ая|вая|мая|рая|чая|вали|мали|рали|хали|ашли|взял|вшим|даем|етны|ечал|знал|знаю|зови)\b)\s{1,4}(\bместа\b)=$1 местА
@(\bместа\b)\s{1,4}(\w+(ают|лить|удут|(ж|к|х|ш|щ)ие|ые|ятся)\b)=местА $2
удалил доп слово (\s?(\w+)? и добавил регистрозависимость, т.е. на обработанные эти правила не сработают.
Словарик самый последний, то что не смогли основные...
На тхт файле в пол метра дало 17 срабатываний и из них 3 дважды - 20 фраз с омографом в плюс
Хороший результат. но...
в BXD + 30минут
в REX (Демагог) + 11минут
в DIC (KooBAudio )- около минуты...
:suspect:

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#41

Сообщение tonio_k »

wasyaka писал(а):
17 дек 2018 10:33
в DIC (KooBAudio )- около минуты...
а результаты срабатывания идентичные? Срабатывают все подходящие правила или только первое подходящее?

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#42

Сообщение wasyaka »

tonio_k писал(а):
17 дек 2018 11:22
Срабатывают все подходящие правила или только первое подходящее?
В проге используется 1 словарь - так сказать "полировка" :russian: (извлёк подходящие из 06 регулярные выражения у MoppoH)
Окончания.rar
(14.13 КБ) 1075 скачиваний
и одно (два если окончание после омографа) правило, Специально сверку не делал.

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#43

Сообщение tonio_k »

Вообще, KooBAudio у меня на старом ноутбуке ЦП грузит на 90-100% и держит нагрузку на время обработки всей книги. В таком режиме мой ноут отключается через час от перегрева. Это была одна из первых причин отказа от KooBAudio. Однако только загрузкой процессора скоростью в 11 раз быстрее чем в Демагоге не обьяснить... Тут только гипотезы строить. Все равно автора KooBAudio не найти что бы секретом поделился :secret:

Аватара пользователя
balabolka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#44

Сообщение balabolka »

tonio_k писал(а):
17 дек 2018 23:13
Тут только гипотезы строить. Все равно автора KooBAudio не найти что бы секретом поделился
Никакого секрета нет: KooBAudio написан на .NET Framework и использует классы из пространства имен System.Text.RegularExpressions. Это совсем другая платформа, и что касается обработки регулярных выражений - очевидно, там она реализована лучше.

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#45

Сообщение tonio_k »

wasyaka, в словарях dic нашел много правил подходящих под шаблон:
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
пример:
► Показать
Убрал все правила (их оказалось довольно много) подходящие под эти шаблоны и заменил на выше указанные три правила со звездочкой, но вот теперь думаю, а не поспешил ли?
Может есть примеры, которые подходят под:
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
но ударение должно быть глазА?

Аватара пользователя
wasyaka
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#46

Сообщение wasyaka »

tonio_k писал(а):
22 янв 2019 10:00
должно быть глазА?
у (больных|бритоголовыхных|неруских|рядовых) глазА закосили :big_smile:

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#47

Сообщение tonio_k »

а если так?
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
у *ких глаза=у ких глазА
у *ных глаза=у ных глазА
у *вых глаза=у ных глазА

Аватара пользователя
SAMERS
Постоялец

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#48

Сообщение SAMERS »

Здравствуйте.
Скачал вашу сборку Балаболки.
Загрузил книгу.
Книга весит 1.5 Мб
Профиль выбрал Полный - Обработка всеми словарями Ctrl+T
Обработка около часа длилась.
Затем нажал открыть новый документ.
Затем сохранить как несколько аудиофайлов.
И... Прошло уже 5 часов. Озвучено пока 98%.
Я в шоке от такой скорости.
Что я сделал не так?
Раньше была Балаболка с какими то словарями, ошибок конечно много было в произношении НО за 6 часов я не торопясь мог озвучить 6 книг такого размера а тут одна никак не озвучится.

Аватара пользователя
tonio_k
V.I.P.

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#49

Сообщение tonio_k »

Есть предложение, что при записи в аудио у вас активированы галочками словари. В результате при записи в аудио ранее обработанного текста у вас опять текст обрабатывает активными словарями и только после этого начинается запись в аудио.

Аватара пользователя
SAMERS
Постоялец

{IVONA} Всё включено. Готовые сборки для чтения/записи книг.

#50

Сообщение SAMERS »

tonio_k писал(а):
10 фев 2019 19:19
Есть предложение, что при записи в аудио у вас активированы галочками словари
Ваше предположение верно. Честно сказать не в курсе был что надо их выключать.
Спасибо за подсказку.
Может есть новая сборка?

Ответить

Вернуться в «TTS-Builds»